TRex: Freie OCR-Texterkennung für den Mac in Version 2.0 erschienen

16. Febr. 2026 14:00 Uhr - Redaktion

TRex ist eine quelloffene, kostenlose Texterkennungssoftware für macOS zur Extrahierung von Text aus Bildern, die komplett lokal (und offline) auf dem Rechner läuft. Sie nutzt dazu sowohl Apples Vision-Framework als auch die freie OCR-Engine Tesseract, die über 100 Sprachen erkennt und deren Ursprünge bis in die 1980er Jahre bei Hewlett-Packard zurückreichen (und weiter aktiv entwickelt wird).

TRex setzt einen Apple-Prozessor und macOS Ventura 13 oder neuer voraus und liegt seit kurzem in der Version 2.0 mit LLM-Integration vor. "Verwenden Sie OpenAI, Anthropic, Ollama oder Apple Intelligence für die visuelle Texterkennung. Formatieren, korrigieren oder transformieren Sie erfassten Text automatisch mit LLM". Ebenfalls neu ist die automatische Erkennung von Tabellen mitsamt Datenextraktion und Export als Markdown, CSV oder Text.

Daneben bietet TRex 2.0 weitere Neuerungen, die in den Versionsanmerkungen aufgeführt sind. Bedient wird das Programm über ein systemweites Menü und anpassbare Tastasturkürzel, ein Dock-Icon gibt es nicht. Die LLM-Nutzung ist rein optional, standardmäßig für die Offline-Nutzung sind Apple Vision und Tesseract eingestellt. Benötigt wird mindestens macOS Sonoma 14 bzw. mindestens macOS Sequoia 15 für Apple Vision.

 
TRex
 
TRex: Kostenlose OCR-Texterkennung nutzt Apple Vision und Tesseract.
Bild: GitHub.

 

Der Entwickler beschreibt TRex wie folgt: "TRex erfasst jeden Text direkt in Ihrer Zwischenablage mit der Magie von OCR. Aber was ist OCR überhaupt? Stellen Sie sich vor, Sie haben eine PDF-Datei oder eine Webseite, auf der Sie den Text nicht auswählen können, ein Bild mit Text oder sogar ein YouTube-Video. Vergessen Sie das manuelle Abtippen; mit TRex können Sie Text von überall extrahieren, und das ist so einfach wie das Erstellen eines Screenshots. TRex befindet sich in der Menüleiste und ist genau dort verfügbar, wo Sie es am meisten brauchen."

Das Projekt ist mitsamt Quellcode auf GitHub zu finden, dort können Anwender wie gewohnt Problemberichte und Verbesserungsvorschläge einreichen. Das Programm an sich liegt nur auf Englisch vor, es gibt eine optionale Integration in Workflow-Tools wie Alfred und Raycast. Zur Geschichte von Tesseract heißt es:

"Tesseract wurde ursprünglich zwischen 1985 und 1994 in den Hewlett-Packard Laboratories in Bristol (Großbritannien) und bei Hewlett-Packard Co in Greeley (Colorado, USA) entwickelt, wobei 1996 einige weitere Änderungen für die Portierung auf Windows vorgenommen und 1998 einige C++-Anpassungen vorgenommen wurden. Im Jahr 2005 wurde Tesseract von HP als Open Source veröffentlicht. Von 2006 bis November 2018 wurde es von Google weiterentwickelt."

Seit dem Jahr 2018 ist Google an dem Projekt nicht mehr beteiligt, getragen wird es seitdem von einzelnen Entwicklern, mit Beiträgen auch von der Universitätsbibliothek Mannheim im Rahmen eines Digitalisierungsprojekts.